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摘要 : 已 经 测定 的 昆虫 线粒体 基因 组 中 , 直 刻 目 草 繁 亚 科 的 疑 钩 额 龟 Ruspolia dubia 线粒体 控制 区 长 度 最 短 , 仪 70 
bp。 为 此 , 本 研究 采用 L-PCR 结合 二 次 PCR 扩 增 策略 对 另 一 种 草 繁 亚 科 昆虫 斑 翅 草 熏 Conocephalus maculates 线粒体 
基因 组 序列 进行 了 测定 。 序 列 注释 发 现 : 斑 翅 草 每 线粒体 基因 组 序列 全 长 15 898 bp, A+T 含 量 为 72.05% , 基因 排 
列 与 典型 的 节肢 动物 线粒体 基因 组 一 致 。 全 部 蛋白 质 编码 基因 以 典型 的 ATN 作为 起 始 密码 子 , 9 个 和 蛋白质 编码 基因 
具有 完整 的 终止 密码 子 , 其 余 4 个 以 不 完整 的 T 作 为 终止 信号 。 除 trnS” 外 , 其 余 21 个 tRNAs 均 可 折 和 又 形成 典型 的 
三 叶 草 结构 , 依照 Steinberg 等 (1997 ) 线粒体 特殊 tRNA 结构 类 型 -9, trnS*” 的 DHU 臂 形成 一 个 7 nt 环 , 反 密 码 子 辟 
则 长 达 9 bp, 含 1 个 突起 碱 基 ， 而 不 是 正常 的 5 bp。 斑 翅 草 繁 与 其 他 直 翅 目 昆虫 线粒体 基因 组 的 主要 区 别 在 于 , 在 
1irS ”和 mad1 ，nrad1 和 tr “基因 间 各 存在 一 段 罕见 的 、 大 有 段 的 基因 间隔 序列 ,长度 分 别 为 78 bp 和 360 bp。 其 中 ， 
位 于 nadl 和 trnL”” 之 间 的 基因 间隔 序列 N 链 可 形成 一 个 包含 完整 起 始终 止 密码 子 (ATTATAA) 编码 103 个 氨基 酸 
的 未 知 开放 阅读 框 。 同 义 密码 子 使 用 偏好 与 线粒体 基因 组 编码 的 tRNA 反 密 码 子 匹配 情况 无 关 , 但 与 密码 子 第 3 位 
点 的 碱 基 组 成 紧密 相关 ; 相对 密码 子 使 用 频率 (relative synonymous codon usage，RSCU) 大 于 1 的 密码 子 , 其 第 3 位 点 
全 部 是 A 或 T。 在 已 经 测定 的 直 翅 目 昆 虫 线粒体 基因 组 tRNAs 中 , 均 存 在 一 定数 量 的 碱 基 错 配 , 且 以 G-U 弱 配 对 为 
主 , 表明 G-U 配对 在 线粒体 基因 组 中 可 能 是 一 种 正常 的 碱 基 配 对 形式 。 本 研究 测定 的 斑 蕊 草 繁 线 粒 体 基 因 组 序列 ， 
和 先前 已 经 测定 的 直 翅 目 线粒体 基因 组 序列 一 起 , 可 以 为 重建 直 翅 目的 进化 历史 提供 数据 资源 。 
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Abstract: The mitochondrial genome ( mitogenome) of Ruspolia dubia ( Orthoptera: Conocephalinae ) 
contains a short control region with 70 bp in length. So, the mitogenome of Conocephalus maculates come 
from Conocephalinae was sequenced by using long-PCR and sub-PCR techniques. The mitogenome of C. 
maculates is 13 898 bp in size, its A + T content ls 72. 05% and the genome organization follows the 
ancestral insect gene arrangement. All protein-coding genes (PCGs) start with a typical ATN codon, while 
nine of the 13 PCGs end with TAA or TAG, and the remainder have incomplete termination codons 工 . 
Except for trnS’”, all 21 tRNAs have the typical clover-leaf structures. According to the unusual Type-9 of 
Steinberg et al. (1997), the DHU arm of trnS’” forms a simple 7-nt loop and the anticodon stem has nine 
base-pairs with a bulged nucleotide in the middle in contrast to the normal five base-pairs. The main 
differences between C. maculatus and other orthopteran mitogenomes was that two novel larger intergenic 
spacers (78 bp and 360 bp) between trnS”” and nadl, nad]l and trnL””, respectively. The intergenic 
spacer between nad] and trnL””" has been labeled unidentified open reading frame ( UORF) because N 
strand comprises an open reading frame (103 amino acids) complete with start and termination codons 


(ATT/TAA). The usage of synonymous codon markedly is correlated with the nucleotide at the 3rd codon 
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position, but has no relation to the anticodon of mitogenome tRNA. Generally, for al codons with their 


relative synonymous codon usage (RSCU ) more than 1, the 3rd codon positions are A or T. Noncanonical 


matches of G-U base pairs accounts for the overwhelming majority of total unmatched base pairs in the 


orthopteran mitogenome tRNAs. The results suggest that the G-U may be one cognitive base pairing in 


mitogenome. The C. maculates mitogenome sequences, as well as the previously determined orthopteran 


mitogenomes , provide sequence source to reconstruct Orthoptera evolutionary history. 


Key words: Conocephalus maculates; mitochondrial genome; sequence analysis; intergenic spacer; relative 


synonymous codon usage ( RSCU) 


昆虫 线粒体 基因 组 是 一 个 双 链 、 环 状 DNA 分 
子 , 长 度 介 于 14 ~17 kb, 共 编 码 37 个 基因 , 其 中 ， 
13 个 重 日 质 编码 基 因 分 别 是 细胞 色素 C 氧化 酶 3 
个 亚 基 ( cox1]，cox2，cox3 ) 、 细 胞 色素 5 脱氧 辅 基 
(Cytb)、ATP 合成 酶 亚 基 6 和 8 (atp6 和 atp8)、 
NADH 脱氧 酶 亚 基 1 ~6(nadl ~ nad6) 和 4L 
(nad4L) ,2 个 rRNA 基因 (LrRNA 和 srRNA) 和 22 个 
tRNA 基因 (trn4, trnR, trnN, tirnD, trnC, trnQ, 


UUR CUN 
L L 


trnE, trnF, trnG, trnH, trnl, trn ,trn , trnk., 


SACN SUCN 


irnM, irnpP, irn ,trnT, irnW, irny, 
irnV) ， 组 成 最 小 的 翻译 系统 。 此 外 , 还 包括 一 个 可 
能 与 线粒体 基因 组 转录 和 复制 起 始 调控 相关 的 非 编 
人 码 区 ， 称 为 控制 区 (Wolstenholme，1992; Boore， 
1999 ) 。 

昆虫 线粒体 基因 组 基因 间 排 列 通常 十 分 紧密 ， 
多 数 基因 间隔 序列 仅 1 ~2 bp, 其 至 存在 碱 基 重 辣 ， 
即使 是 少数 较 大 的 基因 间隔 区 , 其 长 度 通 第 也 小 于 
50 bp。 尽 管 如 此 , 在 个 别 种 类 中 也 有 特大 的 基因 
间隔 序列 被 报道 , 如 : 膜 翅 目 意大利 蜂 Apis mellifera 
线粒体 基因 组 的 trnL ”和 cox2 之 间 的 基因 间隔 序 
列 长 度 为 193 bp (Crozier and Crozier，1993 ) ; 红 光 
雄 蜂 Bombus ignitus 线粒体 基因 组 的 trnS" 和 mad7 
之 间 的 基因 间隔 序列 长 度 为 222 bp (Cha er al.， 
2007 ) ; 半 翅 目 Triatoma dimidiata 线粒体 基因 组 的 
trnS"“ 和 nadl 之 间 的 基因 间隔 序列 长 度 为 314 bp， 
该 间隔 序列 由 2 次 重复 的 完整 重复 单元 (135 bp) 与 
部 分 重复 单元 (17 bp 来 自重 复 单 元 5' 端 , 24 bp 来 
自重 复 单元 中 部 ) 组 成 , 该 序列 具备 完整 的 起 始 及 
终止 密码 子 ,， 可 能 编码 一 未 知 基因 (Dotson and 
Beard , 2001 ) ; 户 翅 目 红 锯 角 忌 Pyrocoelia rufa 线 粒 
体 基因 组 的 nad2 和 如" 丈 之 间 的 基因 间隔 序列 长 度 
为 1724 bp, 该 间隔 序列 由 12 次 重复 的 完整 重复 单 
元 (134 bp ) 与 部 分 重复 单元 (116 pp 来 自重 复 单 元 
S 端 ) 组 成 (Bae et al.，2004 ); 直 蕊 目 Xyleus 
modestus 的 线粒体 基因 组 的 tr 和 madl 之 间 的 


,irn 


基因 间隔 序列 长 度 为 259 bp (Sheffield ef al.，, 
2010) 。 这 些 间隔 序列 大 致 分 为 以 下 4 种 类 型 : 1) 
由 特定 重复 单元 重复 一 定 次 数 串 联 而 成 (Dotson and 
Beard, 2001; Bae et al., 2004) ; 2) 具有 极 高 的 A+ 
T 含 量 , 被 认为 是 线粒体 基因 组 的 第 2 个 复制 起 始 
位 点 (Crozier and Crozier, 1993; Cha el al., 2007 ) ; 
3 ) 具 备 完整 的 起 始 、 终 止 密码 子 , 编码 一 定 长 度 须 
基 酸 的 未 知 的 开放 阅读 框 ( Dotson and Beard， 
2001) ; 4) 其 他 基因 间隔 序列 类 型 。 

Flook 等 (1995 ) 测 定 了 第 一 种 下 杷 目 昆 虫 发 星 
Locusta migratoria 的 线粒体 基因 组 全 序列 。 黄 原 等 
(2010) 对 直 翅 目 线粒体 基因 组 研究 的 一 些 重要 发 
现 进 行 了 综述 。 目 前 ，GenBank 数据 库 中 共 收 录 下 
翅 目 昆虫 线粒体 基因 组 全 序列 数据 34 种 , 其 中 , 24 
种 来 自 蝗 亚 目 ，10 种 来 自 繁 亚 目 (http: //www. 
ncbi. nlm. nih. gov/genomes/ORGANELLES/) 。 这 些 
线粒体 基因 组 全 序列 长 度 介 于 14 971 ~ 17 004 pp 
之 间 , 长 度 差异 主要 源 目 控制 区 长 度 差 异 ， 其 中 ， 
星 亚 目 牛 蝗 总 科 Physemacris variolosa 的 控制 区 最 
长 , 达 2 277 bp (Sheffield et al.， 2010), 我们 测定 
的 每 亚 目 草 每 亚 科 疑 钩 额 生 Ruspolia dubia 拥有 目 
前 已 报道 的 最 短 的 线粒体 控制 区 (70 bp) (Zhou et 
al.,， 2007) 。 为 此 , 本 文 对 另 一 种 草 和 区 亚 科 昆 虫 碍 
划 草 委 Conocephalus maculates 线粒体 基因 组 全 序列 
进行 了 测定 。 


1 材料 与 方法 


1.1 试 虫 

斑 茵 章 繁 C. macujates 标本 采集 于 河北 省 顺 平 
县 (38°83'N, 115°13'E), 标本 采集 后 浸泡 于 无 水 
酒精 中 , 于 4 保存 , 期 间 更 换 酒精 数 次 。 
1.2 总 DNA 提取 

取 单 头 雄 性 标本 的 后 足 股 节 肌 肉 , 采用 常规 的 
酚 - 氧 仿 法 提取 总 DNA。 
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1.3 ”PCR 扩 增 与 序列 测定 

使 用 2 对 L-PCR 引物 ( 刘 念 等 ,2006 ) 将 斑 翅 
草 和 化 的 线粒体 基因 组 扩 增 为 2 个 相互 重重 的 片段 
(A 和 B)。 其 中 , 片段 A 长 度 约 为 8.5 kb, 涵盖 线 
粒 体 基因 组 的 cox7 至 cyib 3' 端 。 使 用 的 引物 对 为 
LP03 (5’-CATTTATTTTGATTYTTTGGWCAYCCAGA 
AGT-3’) 和 LP04 (5’-AAAATWGCRTAWGCAAATAR 
AAAATATCATTC-3')。 扩 增 反 应 程序 为 : 94"C 预 恋 
性 2 min, 92% 变性 10 s, 44% 退火 30 s, 前 15 个 循 
环 68 忒 延伸 8 min, 后 15 个 循环 每 个 循环 延伸 时 间 
增加 20 s, 最 后 68% 延伸 7 min。 片 段 B 长 度 约 为 
9.0 kb, 涵盖 线粒体 基因 组 的 cyib 5' 端 至 cox2。 使 
用 的 引物 对 为 LPCyt b (5'-WACACCAGTTCATATTD 
AACCAGAATGATATT-3’) 和 LPCOIL (5’-TGATTAG 
CTCCACAAATTTCTGAACATTGACC-3')。 扩 增 反 应 
程序 为 : 94C 预 变性 2 min, 94% 变性 30 s, $9.6% 退火 
并 延伸 15 min, 共 30 个 循环 , 最 后 68 人 延伸 7 min。 

经 琼脂 糖 凝 胶 电 泳 切 胶 纯化 后 ，L-PCR 扩 增 产 
物 被 用 于 二 次 PCR 扩 增 模板 。28 条 扩 增 产物 长 度 
介 于 0.6 ~1.4 kb 之 间 , 第 1 轮 首 先 采 用 PCR 法 双 
问 卫 接 测 序 , 少数 测序 结果 不 理想 的 片段 , 则 进行 
第 2 轮 克 隆 测序 ,克隆 使 用 的 载体 为 pMD 19-T 载 
体 (TaKaRa) 。 测 序 试剂 盒 为 ABI PRISM BigDye 
Terminator v3.1，PCR 法 直接 测序 引物 与 二 次 PCR 
扩 增 引物 相同 。 测 序 仪 为 ABI PRISM ”3100-Avant 
Genetic Analyzer。 
1.4 序列 组 装 与 注释 

斑 翅 草 煞 线粒体 基因 组 测序 结果 拼接 与 注释 使 
用 Staden 序列 分 析 软 件 包 进行 (Staden et al.， 
2000) 。 首 先 , 使 用 tRNAscan-SE 进行 tRNA 编码 基 
因 注 释 (Lowe and Eddy，1997 )， 少 数 通过 
tRNAscan-SE 无 法 识别 的 tRNA 编码 基因 、 重 日 质 编 
码 基 因 、rRNA 编码 基因 则 采用 Staden 软件 包 中 的 
Spin 软件 , 通过 与 近 绿 种 同 源 序列 比 对 , 结合 Blast 
同 源 搜索 确定 。 我 们 使 用 MEGA 4. 0 对 线粒体 基因 
组 各 部 分 的 碱 基 组 成 和 密码 子 相 对 使 用 频率 
(relative synonymous codon usage ，RSCU ) 进行 统计 
( Kumar et al., 2004 ) 。 


2 结果 与 分 析 


2.1 基因 组 基因 组 成 与 排列 

斑 志 草 熏 线粒体 基因 组 全 长 13 898 bp, A+T 含 
量 72.05% (已 提交 至 GenBank 数据 库 , 序列 号 为 
HQ711931 ) 。 基 因 组 成 和 基因 间 的 相对 位 置 与 典型 


的 节肢 动物 线粒体 基因 组 一 致 , 共 编 码 37 个 基因 ， 
包括 13 个 和 量 白 质 编码 基因 、22 个 tRNA 编码 基因 和 2 
个 rRNA 编码 基因 和 一 段 非 编码 的 控制 区 。 除 4 个 
蛋白 质 编 码 基 因 (nad1, nad4, nad4L 和 nad5)、2 个 
TRNA (ZrRNA 和 srRNA) 和 8 个 tRNAs (irnQ, trnC, 
trny, trnF, tmH, trmP, trmL“" 和 tmV) 由 NN 链 编 码 
外 ,其余 23 个 基因 均 由 丁 链 编码 (图 1; 表 1)。 
1 


M 


Conocephalus maculatus 


Mitochondrial genome 
15899 bp 





图 1 斑 翅 草 每 线粒体 基因 组 组 织 结构 图 
Fig.1 Gene map of the Conocephalus maculatus mitogenome 
图 中 深 色 部 分 为 两 个 大 的 基因 间隔 区 ，N 链 编码 的 蛋白 质 基因 和 
rRNA 基因 以 下 划 线 标 出 , tRNA 基因 于 圈 内 侧 以 单字 母 缩写 的 形式 
标 出 。Two novel larger intergenic spacers are marked with dark. PCGs 
( protein-coding genes) and rRNAs with underline and one-letter symbol 


of tRNAs within the circle indicates that was coding on N strand. 


斑 茵 草 繁 线 粒 体 基 因 组 基因 间 重 二 长 度 为 1 ~ 
8 bp, 共 13 处 , 总 长 度 为 37 bp。 斑 翅 草 每 线 粒 体 
基因 组 中 共 包 括 12 处 基因 间隔 序列 ,其 中 ,10 处 
基因 间隔 序列 , 长 度 为 1 ~3 bp, 总 长 度 为 16 bp， 
另外 两 处 大 的 基因 间隔 序列 , 位 于 trnS ”和 mrad1 ， 
以 及 nadl 和 xz 之 间 ，, 长 度 分 别 为 78 bp 和 360 
bp。 其 中 , nadl 和 trmL”” 之 间 的 基因 间隔 序列 N 
链 可 形成 一 个 包含 完整 起 始 、 终 止 密码 子 (ATT/ 
TAA)、 编 码 103 个 须 基 酸 的 未 知 开放 阅读 框 。 
2.2 人 笋 白质 编码 基因 

斑 翅 草 繁 线粒体 基因 组 中 ,13 个 蛋白质 编码 
基因 的 起 始 密码 子 均 为 AIN， 分 别 为 ATC 6 个 
(cox2, aip6, cox3, nad4, nad4L 和 cytb), ATT4 个 
(aip§, nad5, nad6 和 nadl ), ATA 1 个 (nad3 ) ， 
ATC 2 个 (nad2 和 cox7 ) 。9 个 蛋 日 质 编 码 基因 拥有 
完整 的 终止 密码 子 , 分 别 为 TAA 8 个 (mad2 ，cox71 ， 
atp8, cox3, nad6, cytb, nadl 和 mad45) 和 TAGTI 个 
(nad3)。4 个 蛋白 质 编 码 基 因 以 T 作 为 终止 信和 号。 
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表 1 斑 翅 草 扬 线粒体 基因 组 组 成 


Table 1 Organization of the Conocephalus maculatus mitogenome 


基因 /区 域 位 置 长 度 (bp) 方 问 基因 间隔 碱 基 重 益 起 始 / 终 止 密码 子 得 分 
Gene/ Region Position Size Direction Non OL Start/ Termination codon Score 

trnl 1 -65 65 F 18.74 
trnQ 66 — 134 69 R 1 30. 86 
trnM 134 - 199 66 F 32.70 
nad2 200 -1 231 1 032 F 2 ATC/TAA 
trmW 1 230 -1 296 67 F 1 33.74 
trnC 1 298 -1 363 66 R 1 23.44 
trnY 1 365 -1 430 66 R 8 18.98 
cox] 1 423 -2 958 1 330 F 2 ATC/TAA 

tL 2 901 -3 025 65 F 1 32. 20 
cox2 3 027 -3 717 691 F ATG/T 
trmk 3 718 -3 787 70 F 1 28.55 
trnD 3 787 -3 854 68 F 35.73 
aitps 3 833 -4 013 139 上 7 ATIZTAA 
alpO 4 007 -4079 673 F ATG/T 
cox3 4 680 -3 468 789 F 3 ATG/TAA 
trnG 3 472 -3 337 66 F 3 26. 82 
nad3 3 535 -3 891 357 F 2 ATA/TAG 
trnA 3 890 -3 952 03 F 1 33.01 
trmmR 3 932 -6 017 66 F 3 22.34 
trnN 6 021 -6 087 67 F 2 20.01 

trnSAeN 6 090 -6 156 67 F 1 
trnE 6 138 -6 224 67 F 2 29.82 
trmmF 6 223 -6 287 65 R 24.59 
nadS 6 288 -8 019 1 732 R ATT/T 
trmmH 8 020 -8 086 67 R 15.99 
nad4 8 087 -9 425 1 339 R 7 ATG/T 

nad4L 9 419 -9 715 297 R 1 ATG/TAA 
trnT 9 717 -9 780 64 F 1 29.23 
trnP 9 780 -9 844 65 R 1 

nad6 9 846 -10 367 522 F 1 ATT/TAA 
Cytb 10 367 -11 300 1 140 F 1 ATG/TAA 

tS 11 306 -11 S74 69 F 78 51.26 
nad] 11 653 -12 600 948 R 360 ATI/ATAA 

tmLeuN 12 961 -13 025 65 R 33.17 
IrRNA 13 026 -14 330 1 305 R 
trnV 14 331 -14 400 70 R 39.67 

srRNA 14 401 -15 236 836 R 

皖 制 区 13 237 -13 898 662 一 662 


Control region 


F: 表示 正和 加 Forward direction; R: 表示 反 回 Reverse direction; Non : 非 编 码 区 域 Non-coding region; OL: 碱 基 重 夫 区域 Overlapping region. 
”tRNAscan-SE 预测 打分 Score by tRNAscan-SE. 
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得 翅 草 秘 线 粒 体 基因 组 蛋白 质 编码 基因 不 同位 
点 间 的 碱 基 组 成 见 表 2。13 个 蛋白 质 编码 基因 的 平 
均 A+T 含 量 为 70.9% , 其 中 , 密码 子 的 第 3 位 点 
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含量 为 83.0%, 高 于 第 1 位 点 的 64.8% 和 第 2 位 点 
的 64.7% 。 


表 2， 斑 翅 草 粤 线 粒 体 基因 组 不 同 区 域 的 碱 基 组 成 


Table 2 Nucleotide composition in different regions of the Conocephalus maculatus mitogenome 


Proportion of nucleotides 


T% C% 
全 基因 组 Whole genome 34.5 16.8 
蛋白 质 编码 基因 Protein-coding genes 40.9 14.9 
密码 子 第 1 位 点 1st codon position 34.9 14.2 
密码 子 第 2 位 点 2nd codon position 44.8 20.4 
密码 子 第 3 位 点 3rd codon position 43.0 10.2 
tRNA 基因 tRNA genes 36.0 11.8 
IrRNA 38.9 8.1 
srRNA 38.5 9.8 
控制 区 Control region 37.6 11.8 


13 个 线粒体 蛋 日 质 编 码 基 因 共 包括 3 736 个 密 
码 子 (不 包括 4 个 不 完整 的 终止 密码 子 ), 密码 子 使 
用 情况 如 表 3 所 示 。 第 3 位 点 是 碱 基 A 或 的 密码 
子 (3 115 个 ) 占 密码 子 总 数 的 83. 38% ， 相 对 密码 
子 使 用 频率 (RSCU ) 大 于 1 的 密码 子 , 其 第 3 位 点 
全 部 是 A 或 T。22 个 与 线粒体 基因 组 编码 的 tRNA 
有 反 密 码 子 完 全 匹配 的 密码 子 中 , 仅 10 个 相对 密码 
子 使 用 频率 大 于 1。4 种 含量 最 高 的 氨基 酸 分 别 为 
亮 须 酸 (16. 47%)、 丝 氨 酸 (9. 02%)、 茶 两 氨 酸 
(8.77% ) 和 有 异 亮 须 酸 (8. 46%)， 占 总 数 的 
42.72% 。 
2.3 tRNA 和 TRNA 编码 基因 

斑 芭 草 繁 线粒体 基因 组 的 22 个 tRNA 编码 基 
,20 个 可 以 通过 tRNAscan-SE 识别 , 仅 trnP 和 
inS ”通过 同 源 序列 比 对 的 方式 加 以 注释 。 全 部 
tRNAs 的 反 密 人 码 子 都 与 Drosophila yacuba 一 至 
(Clary and Wolstenholme，1985 ) 。 除 trnS* “外 ,其 
余 21 个 tRNA 均 可 形成 典型 的 三 叶 草 结构 。trm3 
的 二 级 结构 则 依照 Steinberg 等 (1997 ) 发 表 的 线 料 
体 特殊 tRNA 结构 中 类 型 -9 进行 预测 ( Steinberg et 
al.,， 1997) ,其 DHU 臂 仅 形成 一 个 7-nt 环 , 而 反 密 
码 子 臂 则 长 达 9 bp, 含 1 个 突起 碱 基 ( 图 2)。 

斑 翅 草 龟 线粒体 基因 组 tRNA 中 , 共存 在 23 处 
碱 基 错 配 现象 , 其中, 19 处 为 G-U 形成 弱 配 对 , 其 
余 4 处 分 别 为 : A-A, 位 于 trnM 的 反 密码 子 辟 ; U- 
U, 位 于 trn4 的 氨基 酸 接受 辟 ; U-C, 分 别 位 于 trnK 
和 irnR 的 反 密 码 子 辟 。 


碱 基 组 成 
碱 基数 目 


Number of nucleotides 


A% CG% (A+T)% 
37.6 11.2 72.1 
30.0 14.1 70.9 
29.8 21.0 64.7 
20.0 14.9 64.8 
40.3 6.5 83.3 
37.5 14.8 73.5 1 463 
36.4 16.6 75.3 1 305 
33.1 18.6 71.6 836 
41.4 9.2 79.0 662 


13 898 
11 208 
3 736 
3 736 
3 736 


A—U 
Uj-—A 
G 一 C 
A™—U 
A™—U 
A™—U 
G™C 
C A 
U A 
GCU 
图 2 tr 的 二 级 结构 
SAeN 


Fig.2 Uncommon secondary structure of tirn 


斑 翅 草 生 线粒体 基因 组 的 lrRNA 和 srRNA 分 别 
介 于 trnL”” 和 trnV, trnV 和 线粒体 控制 区 之 间 。 其 
中 ,LrRNA 长 度 为 1 344 bp, A + 本 含量 为 75.2%，; 
srRNA 长 度 为 835 bp, A + 了 含量 为 71.7% ( 表 2)。 
2.4 控制 区 

斑 翅 草 煞 线粒体 基因 组 的 控制 区 介 于 srRNA 和 
trnJ-trnQ-trnM 之 间 , 长 度 为 662 bp, A + 含量 为 
79% , 在 线粒体 各 个 组 分 中 仪 次 于 和 蛋白质 编码 基因 
的 第 3 位 点 ( 表 2)。 我 们 进行 进一步 序列 分 析 发 
现 : 在 斑 记 草 急 线粒体 基因 组 控制 区 J 链 存在 2 个 
连续 的 T 族 , 长 度 分 别 为 19 bp 和 10 pp; N 链 同 样 
存在 2 个 连续 的 T 族 ,长度 分 别 为 8 bp 和 9 bp。 
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表 3 斑 翅 草 惫 线粒体 基因 组 蛋白 质 编 码 基因 的 密码 子 使 用 


Table 3 Codon usage in protein-encoding genes of the Conocephalus maculatus mitogenome 











氨基 酸 密码 子 数目 相对 使 氨基 酸 
Amino acid € Codon n 用 频率 || Amino acid Codon 
RSCU 
Leu (L) UUA 385 3.76 
UUG 50 0.49 
CUU 71 0.69 
CUC 21 0.21 
CUA 79 0.77 
CUG 8 0.08 
Ser (S) UCU 91 2.17 
UCC 29 0.69 
UCA 87 2.07 
UCG 6 0.14 
AGU 54 1.29 
AGC 15 0.36 
AGA 51 1.21 
AGG 3 0.07 
Phe (了 ) UUU 264 1.61 
UUC 63 0.39 
lle (1) AUU 265 1.68 
AUC 51 0.32 
Gly (GC) GGU 74 1.32 
GGC 12 0.21 
GCA 96 1.71 
GGG 43 0.76 


密码 子 











氨基 酸 密码 子 “数目 。 相对 使 
Amino acid € Codon n 用 频率 
RSCU 
Trp (W) UGA 98 1. 87 
UGG 7 0.13 
His( H) CAU 57 1.36 
CAC 27 0.64 
Lys ( 开 ) AAA 58 1.40 
AAG 25 0.60 
Glu (E) GAA 73 1. 80 
GAG 8 0.20 
Asp(D) GAU 60 1.62 
GAC 14 0.38 
Gln( Q) CAA 68 1. 84 
CAG 6 0.16 
Arg (R) CGU 24 1.63 
CGC 5 0. 34 
CGA 24 1.63 
CGG 6 0.41 
Cys (C) UGU 36 1.67 
UGC 7 0.33 
Ter. UAA 8 1.78 
UAG 1 0.22 
总 计 Total 3 736 


n: 密码 子 使 用 次 数 Number of codon used; RSCU : 相对 密码 子 使 用 频率 Relative synonymous codon usage; 下 划 线 标 出 的 密码 子 与 线粒体 编码 的 
tRNA 反 密 码 子 完全 匹配 The anticodons of the corresponding tRNA were shown with underline; Ter. : 终止 密码 子 , 不 包括 4 个 不 完全 终止 密码 子 T 


Termination codon, excluding 4 incomplete termination codons T. 


3 讨论 


昆虫 线粒体 基因 组 基因 间 排 列 紧密 , 基因 间隔 
序列 通常 只 有 几 个 碱 基 。 斑 翅 草 瓯 线粒体 基因 组 中 
发 现 两 段 大 的 基因 间隔 序列 (78 bp 和 360 bp)，, 分别 
位 于 trmS* 和 nadl, nadl 和 45 “之 间 。 类 似 的 情 
况 仅 在 个 别 昆 虫 中 被 报道 , 例如 意大利 蜂 、7 
dimidiata、 红 锯 角 萤 、 红 光 雄 蜂 、X. modestus (Crozier 
and Crozier ，1993 ; Dotson and Beard, 2001; Bae et al., 
2004 ;Cha et al., 2007 ; Sheffield et al., 2010) 。 其 中 ， 
位 于 nadl 和 trnL” 之 间 的 基因 间隔 序列 与 半 翅 目 
T，dimidiata 类 似 , 在 其 N 链 可 形成 一 个 包含 完整 起 
始 、 终 止 密 码 子 (ATTATAA)、 编 码 103 个 氨基 酸 的 未 
知 开放 阅读 框 。 通 过 BLAST 进行 序列 相似 性 搜索 ， 
在 CenBank 中 未 发 现 相似 的 已 知 基因 序列 。 


斑 诸 草 盆 线粒体 基因 组 中 , 4 个 和 蛋 日 质 编 码 基 
因 以 不 完整 的 终止 密码 子 T 作为 终止 信号 。 在 屁 
虫 线粒体 基因 组 中 ,以 不 完整 的 终止 密码 子 T 作 为 
终止 信号 非常 普遍 , 通常 认为 其 可 以 通过 转录 后 的 
聚 腺 苷 酸化 形成 完整 的 终止 密码 子 (Bibb er al.， 
1981; Ojala，1981 ) 。 

在 线粒体 基因 组 中 , 由 于 密码 子 简 并 性 , 每 种 
去 基 酸 对 应 1 ~ 8 种 不 同 的 同 义 密码 子 。 尽 管 这 些 
氨基 酸 同 时 对 应 多 个 同 义 密 码 子 , 但 是 人 
偏好 于 某 种 特定 的 密码 子 。 这 种 偏好 与 密码 子 第 
位 点 的 碱 基 组 成 紧密 相关 ， 半生 友子 使用 上 
人 1 的 密码 子 , 其 第 3 位 点 全 部 是 A 或 

T。 这 种 偏好 可 能 是 由 于 线粒体 基因 组 A+T 合 

相对 较 高 所 造成 的 偶 傈 突变 压 所 引起 ， 加 在 人 
水 平 上 GC 至 AT 的 正 问 突变 大 于 回复 突变 
( Sueoka, 1962 ) 。 
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斑 翅 草 惫 线粒体 基因 组 tRNA 中 , 共存 在 23 处 
碱 基 错 配 , 其 中 , 19 处 是 G-U 形成 弱 配 对 。 已 经 测 
定 的 直 翅 目 昆 虫 线 粒 体 基因 组 tRNA 中 , 均 存 在 一 
定数 量 的 碱 基 错 配 , 且 均 以 G-U 弱 配 对 为 主 , 约 占 
错 配 总 量 的 80% 以 上 , 例如 : 东方 显 蚌 Gryllotalpa 
orientalis (34 处 碱 基 错 配 ，24 处 为 G-U) (Kim et 
al.，2005 ) ; Anabrus simplex (21 处 碱 基 错 配 ，18 处 
为 G-U) (Fenn et al., 2007) ; 疑 钩 额 熏 (37 处 碱 基 
错 配 , 24 处 为 G-U) (Zhou et al., 2007 ) ; 优雅 帼 短 
Gampsocleis gratiosa (27 处 碱 基 错 配 , 23 处 为 G-U) 
(Zhou et al.，2008 ) ; 北方 玉生 Deracaniha onos (24 
处 碱 基 错 配 , 22 处 为 G-U) (Zhou ef al., 2009) , 这 
些 都 表明 G-U 配对 在 线粒体 基因 组 中 很 可 能 是 一 
种 正常 的 配对 形式 。 

本 文 利用 长 PCR 结合 二 次 PCR 扩 增 技术 测定 
了 斑 基 草 急 线粒体 基因 组 全 序列 ,主要 结论 如 下 ; 
1) 斑 薄 草 生 与 其 他 已 测定 的 直 翅 目 昆 虫 线 粒 体 基 
因 组 最 大 的 区 别 在 于 ,其 基因 组 中 存在 两 段 罕 见 
的 \ 大 的 基因 间隔 序列 。2 ) 在 线粒体 基因 组 tRNA 
中 , 绝 大 多 数 的 碱 基 钳 配 是 C-U 形成 的 弱 配 对 , 推 
测 其 在 线粒体 基因 组 中 可 能 是 一 种 正常 的 配对 形 
式 。 由 于 尚未 证 实 这 些 大 的 基因 间隔 序列 是 否 在 全 
部 王 翅 草丛 个 体 普遍 存在 ,以 及 位 于 mad7 和 
trnL” 之 间 的 基因 间隔 序列 是 否 在 转录 过 程 中 被 转 
录 ,G-U 弱 配 对 是 否 确实 是 一 种 正常 的 配对 形式 ， 
都 有 待 于 转录 组 水 平 验证 。 
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